Importando bibliotecas que serão utilizadas

library(dplyr)
library(purrr)
library(plotly)
library(janitor)
library(ggplot2)
library(corrplot)
source("./source/multiplot.R")

Carregando base e melhorando nome das colunas

base::load("./inputs/us_change.rda")
data <- us_change %>% janitor::clean_names()
  1. Calculando número índice de todas as variáveis, para isto foi criado uma função para auxiliar nos cálculos
calc_indice_variacao <- function(x) {
  y <- x
  y[1] <- 100
  for(i in 2:length(x)) {
    y[i] <- (1 + x[i]/100) * y[i-1]
  }
  return(y)
}
data_indice <- data %>% 
  dplyr::filter((quarter >= as.Date("2000-01-01"))) %>% 
  dplyr::select(-quarter) %>% 
  purrr::map_df(function(x) x %>% calc_indice_variacao())

quarters <- data %>%
  dplyr::filter((quarter >= as.Date("2000-01-01"))) %>% 
  dplyr::select(quarter)


data_indice <- data_indice %>% 
  dplyr::mutate(quarter = quarters$quarter)

Plotando variáveis para efeito de verificação

  1. Criando a correlação entre as variávies utilizando dos dados em número índice
correl <- stats::cor(data_indice %>% 
                      dplyr::select(-quarter))  
##              consumption      income production     savings unemployment
## consumption   1.00000000  0.99511754  0.7558454  0.07822587  -0.11691529
## income        0.99511754  1.00000000  0.7277307  0.17080259  -0.08431893
## production    0.75584542  0.72773073  1.0000000 -0.12579960  -0.54518215
## savings       0.07822587  0.17080259 -0.1257996  1.00000000   0.17372121
## unemployment -0.11691529 -0.08431893 -0.5451822  0.17372121   1.00000000

Criando a correlação entre as variáveis utilizando das variáveis em taxa de variação

correl <- stats::cor(data %>% 
                      dplyr::filter((quarter >= as.Date("2000-01-01"))) %>% 
                      dplyr::select(-quarter))
##              consumption      income  production     savings unemployment
## consumption    1.0000000  0.22891397  0.48396431 -0.24460544  -0.47826764
## income         0.2289140  1.00000000  0.14337067  0.84544089  -0.09033545
## production     0.4839643  0.14337067  1.00000000 -0.06058825  -0.72529302
## savings       -0.2446054  0.84544089 -0.06058825  1.00000000   0.11381076
## unemployment  -0.4782676 -0.09033545 -0.72529302  0.11381076   1.00000000

Como pode-se perceber a correlação em ambos os casos foi diferente, isto ocorre pois as duas bases estão com suas variáveis em níveis diferentes, no caso da base com as variáveis em taxa de variação estão sendo correlacionadas informações em escalas diferentes, desse modo a correlação não estará correta.

  1. Criando visualizações para ajudar no entendimento sobre a dinâmica das variáveis

  1. A partir dos gráficos construídos é possível identificar que as variáveis apresentam uma evolução no tempo com bastantes picos, tanto positivos quanto negativos, isto ocorre devido aos diversos eventos externos que influenciam diretamente na economia do país. Além disso, as variáveis que apresentam uma maior correlação, como por exemplo poupanças e renda, sofrem os efeitos de tais eventos de forma bastante correleta, baseando sempre na matriz de correlação, construída em itens anteriores.

  2. É possível encontrar nas séries alguns movimentos abruptos, como nos anos por volta de 1980 em que os EUA sofreram por um grande período de instabalidade econômica, muito pelo fato de não saber se comportar em frente a novos concorrentes do mercado internacional, além de questões complicadas envolvendo o Oriente Médio. Também é possível identificar movimentos abruptos por volta de 2008-2009, em que os EUA passavam pela sua maior recessão financeira desde 1930.